Population : Ensemble d'elements qui forment le champs d'analyse d'une Loi binomiale : B(n, p) -> probabilite k succes parmi n essais 
etude statistique (Constitute d'ensemble d'individus) , „ ,n\ a- n-k n! k n-k 

p{X=k)={ k ) Pq = k![n _ k]l P q 

Experience aleatoire : Experience qui donne des resultats differents Esperance : E{X)=np Variance : V{X)=npq 

repetee dans les memes conditions 

Loi geometrique : G(p) -> probabilite d'un succes apres k essais 
Variable aleatoire : Variable dont la valeur depend du resultat d'une p(X-k)- pq" 

experience aleatoire Quantitative (Continue ou discrete) ou qualitative Esperance ■ E(X)= — Variance ■ y(x)- ^ 



Moyenne d'une VA : m=— 1 x, 
n 

Variance d'une VA : s 2 =—X{x r m) 2 
Ecart-type d'une VA : s=\' Variance 



Loi de probabilite : Pour une VA qualitative ou quantitative discrete 

f(x)=P(X=x) f{x)e[0;l] 
2 p, = l 

Densite de probabilite : Pour une VA quantitative continue 

f(x)dx=P[x<X<x + dx) f{x)>0 
ff(x)dx = 1 

Fonction de repartition : Pour une VA quantitative discrete ou continue 

F {x) = jf{x )dx = P{X<x) F (a-)g[0 ; 1 ] 



Echantillon de tall le n : Realisation n fois de la variable X 



X + X+...+ X 

Moyenne: M= — 

n 

E(M)=p Var{M) = ^ 

Theoreme central limite (TCL) : Toute somme de n variables (n > 30) 
aleatoires independantes qui suivent des lois de probabilites tend vers une 
VA dont la loi converge vers la loi normale. 

^ M ~N{fi;—) 



Loi normale :X~N(mo 2 ) 

Moyenne : u. Variance : o 2 

Z = X u - - JV(0;l) -> Loi normale centree reduite 
Fonction de repartition de N(0;1) notee <p(z)=P(Z<z) 



ct= risque de premiere espece P(rejet de H 0 |H 0 estvraie) 

(3 - risque de seconde espece P (non-rejet de H 0 | Hi est vraie) 

-> lis sont antagonistes (Varient en sens inverse selon la regie de decision) 

Puissance : P(rejet H 0 |Hiest vraie) 

On est au dela de la regie de decision et sous HI, on doit done definir un 
parametre de reference pour calculer la puissance 
-> Courbe de puissance : P = f(u.) 

Plus n est grand, plus P augmente pour des effets faibles 



Diagramme de dispersion : Chaque point represente un individu de 
coordonnees (x i( y.) pour deux VA X et Y 

On peut avoir : 

- Une relation lineaire negative (Droite decroissante) 

- Une relation lineaire positive (Droite croissante) 

- Pas de relation lineaire (Droite horizontale ou nuage de points) 

Coefficient de correlation : 



p=Cov 



^Var{X)Var[Y) 



Formules Excel : 

INTERVALLE.CONFIANCE(a, a, n) donne la precision de I'intervalle 
VAR.P(Plage) donne la variance dans I'echantillon 
VAR(Plage) donne I'estimateur ponctuel de la variance dans la population 
LOI.STUDENT.lNVERSE(ct, ddl) donne let Q/2 
LOI.NORMALE.INVERSE(l-a/2, esperance, variance) donne le 
MOYENNE(Plage) donne la moyenne dans I'echantillon 



Estimation : Procedure d'utilisation des informations obtenues a partir d'un 
echantillon et qui permet de deduire des resultats concernant I'ensemble de 
la population 





Moyenne 


Variance 


Proportion 


Population 


H 


a 2 


TI 


Echantillon 


m 


s 2 


P 



Estimateur (T) : Fonction statistique utilisee pour trouver une valeur 
approchee d'une parametre inconnu dans la population (6) 

sansbiais: E(T)=& 

convergent: lim Var(T)=Q 

Estimation ponctuelle : On propose une seule valeur comme estimateur 
du parametre inconnu 
\x=M et 11= p 



s 2 — — 2 ( x— m) 2 — — \ 1.n i x 2 



et sans biais a 2 



■(n-l)' 



Estimation par intervalle de confiance : On donne un intervalle de 
valeurs dans lequel 8 a une probabilite 1-ct de se trouver 



IC l _ a =[m±z, 



2 \ n 



Pour une moyenne (n > 30) 

Pour une proportion nk>5 ■ =[ ± IHlz 

Pour une moyenne ( n < 30) : . \ o 2 n 

IC \-u=y m±t a [n-\)ddl^ — \ 

Precision d'un intervalle de confiance : largeur de cet intervalle 

Intervalle de tolerance : On peut le calculer si I'hypothese nulle est vraie 
II est centre sur la valeur de reference, n7i, la largueur de I'intervalle dimine 
-> Si la valeur a tester se trouve dans I'intervalle, I'hypothese nulle est 
credible 



Tests d'hypothese sur des VA quantitatives 



Test d'hypothese sur des VA qualitatives : 



Test du Khi-deux : 



Test de conformite 



Test de conformite 



1) On definit la variable aleatoire, son nombre de classe k et n 



1) On definit la variable aleatoire quantitative, on trouve m, a 2 et n 

2) On formule des hypotheses par rapport au parametre dans la population 



1) On definit la variable aleatoire qualitative, on trouve p et n 



H ] :/j^/j q pour un test bilateral ^<^ o pour un test unilateral 

3) On verifie les conditions de validite 

- n > 30 pour les grands echantillons 

n < 30 et X~/V pour les petits echantillons 

4) On definit une regie de decision : 
Si H 0 estvraie M ~N{/i 0 ;—) 



2) On formule des hypotheses par rapport au parametre dans la population 
H j :ti^ji q pour un test bilateral n <Jt 0 pour un test unilateral 



fi f_° )=l— g pour un test bilateral 

o 1 1 

17 

.. -u 

| = l-a pour un test unilateral 



I? 



3) On verifie les conditions de validite 
n>30, nn 0 >5 et n(l-n 0 )>5 

4) On definit une regie de decision : 

71 J 1 — jr.) 

Si H„ est vraie P~N(x 0 ; - — ) 
P<\J>pJhf ■» 

P(p> Pum )=a -> 



2) On formule des hypotheses par rapport a la repartition et au modele 
theorique : 

H Q :le. modele theorique est respecte 
H { :le. modele theorique n ' est pas respecte 



3) On fait un tableau de contingence avec les effectifs observes et les effectifs 
calcules sous I'hypothese nulle 

4) On verifie les conditions de validite : 

C>5 ou les C.sont les effectifs calcules sous I'hypothese nulle 



5) On calcule : 



{o r cy 



pour un test bilateral 



6) On calcule % 



lim.u,[k-\)di 



= 1 -a pour un test unilateral On compare Xcai et Xi, m : 

-> Si Xcai > Xiimi on rejette H 0 



On peut calculer mi im en cherchant dans la table de la loi normale centree 
reduite 

5) On compare m et mi im : 
-> Si m > miim , on rejette H 0 
-> Si m < mi™ , on rejette Hi 



On peut calculer plim en cherchant dans la table de la loi normale centree 
reduite 

5) On compare p et pi im : 
-> Si p > p| jrn , on rejette H 0 
-> Si p < p| jrn , on rejette Hi 



Si Xcai < Xi™, on rejette Hi 
Test d'homogeneite entre deux repartitions : 



On definit la variable aleatoire, son nombre de classe k et n pour chaque 
echantillons et c le nombre d'echantillons 



Test de comparaison 

1) On definit la variable aleatoire quantitative, on trouve les m, les a 2 et les n 



2) On formule des hypotheses par rapport au parametre dans la population 

H . :u y£u pour un test bilateral A B pour un test unilateral 

1 4 B Pa^Pb 



3) On verifie les conditions de validite 

n A et n B > 30 pour les grands echantillons 
- n < 30 et X~N pour les petits echantillons 

4) On definit une regie de decision : 

On pose M A -M B =D~N{fi A -fi B ;— +— ) 



Si Ho est vraie D ~N{0;^— + — 



H\A>dJ=\ ■* 



si independantes 



P(d>d,. )=a -> «/( . "" =) = l-q pour un test unilateral 



On peut calculer di im en cherchant dans la table de la loi normal centree 
reduite 



5) On compare d et di lm : 
-> Si d > dii m , on rejette H 0 
-> Si d <d n „, on rejette H, 



Test de comparaison 

1) On definit la variable aleatoire qualitative, on trouve les p et les n 

2) _On formule des hypotheses par rapport au parametre dans la population 

H : jt — jt 

ir_ ) <ir s 

H x :ti a ^ti b pour un test bilateral n >7Z pour un test unilateral 



3) On verifie les conditions de validite 
n A etn B >30, n A x A >5 et n A (l—K A )>5 
n.n.>5 n„(l-it,)>5 



4) On definit une regie de decision 
On pose P a -P b =D~N(k a -h b 



it (1-ir ) n {l-n„). 
Si H„ est vraie D~^(0, — —+— — ) si independantes 



i lim - j _ i _ a. 

U A {l-n A ) + k b {1-k b ) 2 

1 n A n B 



P(d>d J J=a -> 



On peut calculer d (im en cherchant dans la table de la loi normal centree 
reduite 

5) On compare d et d| im : 

Si d > d| im , on rejette H 0 
-> Si d < diim , on rejette Hi 



On formule des hypotheses par rapport a la repartition et au modele 
theorique : 

H Q : le. modele theorique est respecte 

H l ;le. modele theorique n 'est pasrespecte 

On fait un tableau de contingence : 

On peut calculer la probability d'etre dans une classe si c'est 
independant de I'echantillon 

On peut done calculer les effectifs theoriques en multipliant 
cette probability par I'effectif de I'echantillon 



4) On verifie les conditions de validite : 

C >5 ou les C.sont les effectifs calcules sous I'hypothese nulle 



5) On calcule : 



en prenant en compte tous les termes 



6) On calcule X 2 lim a {k _ ■ 

On compare Xcai et Xirm : 

Si Xcai > Xiim. on rejette H 0 
-> Si Xcai < Xi™, on rejette Hi 



Test d'egalite des variances si n < 30 

1) On calcule les variance des deux echantillons 

2) On formule des hypotheses : 

\ H X-&A*&B 

3) On definit une regie de decision : 

On regarde Fi im dans la table de la loi de Fischer dans la colonne (n-l)ddl pour 
n individus dans I'echantillon avec la plus grande variance et dans la colonne 
(n-l)ddl pour n individus dans I'echantillon avec la plus petite variance 

4) On compare avec : 

®A 

F ' caI =-K- ou I'inverse pour avoir un F ca , le plus grand possible 



5) On conclut : 

-> Si F ca , > Fiim, on rejette H 0 
-> Si F ca i < Fiim, on rejette Hi 

M -A 

6) On a alors T= 



I "a »j 



-\)a.*+(n.-\)a. 



V "a "b 
Va-Vb 



7) On compare avec t^ a[nA ^ B . 2]m 



